جانهی داده های گمشده در آمارگیری های پانلی با استفاده از الگوریتم em
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده اقتصاد
- author آسیه رشیدی نژاد
- adviser حمیدرضا نواب پور مجتبی گنجعلی
- Number of pages: First 15 pages
- publication year 1388
abstract
در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در انواع آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معمولاً با کاهش پاسخگو در دوره های دوم به بعد تولید داده ها مواجه هستند. این امر که منجر به نمونه ی کاهیده می شود سبب کاهش کارایی براوردگرها و غالباً نیز سبب اریبی آن ها می شود. برای برخورد با این مشکل در آمارگیری پانلی روش های «جانهی» و «وزن دهی» گوناگونی وجود دارد که از جمله ی این روش های جانهی، جانهی با الگوریتم em می باشد. الگوریتم em یک الگوریتم مکرر برای براورد ماکسیمم درستنمایی مسئله ی داده های گمشده یا ناتمام می باشد. با توجه به این که ساختار گمشدگی تصادفی فرض شده است لذا این الگوریتم برای جانهی مناسب می باشد. در این پایان نامه پس از معرفی مفهوم های اولیه آمارگیری پانلی، انواع گمشدگی در آمارگیری های پانلی و ساختارهای گمشدگی، الگوریتم em به عنوان روشی برای جانهی داده های گمشده معرفی می شود و به دلیل مشکلاتی که در محاسبات این الگوریتم ممکن است وجود داشته باشد چهار نوع از این الگوریتم معرفی می شود. سرانجام با استفاده از داده های آمارگیری پانلی خانواری انگلیس، توزیع نمونه گیری شبیه سازی شده و روش جانهی با الگوریتم em با دو روش جانهی با میانگین مشاهده های مشابه و جانهی با نمونه ی جدید از نظر معیارهای مختلف (با توجه به اثر اندازه ی نمونه، همبستگی بین دوره ها و نرخ بی پاسخی دوره) مقایسه می شوند. نتایج این مطالعه نشان می دهد که جانهی متغیر تحت بررسی در آمارگیری پانلی خانواری انگلیس با استفاده از الگوریتم em وقتی که همبستگی بین دو دوره زیاد باشد، عملکرد بهتری دارد.
similar resources
مقایسه ی جانهی الگوریتم em با دو روش جانهی میانگینی و نمونه های جدید در آمارگیری های پانلی
در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معم...
full textمقایسهی جانهی الگوریتم EM با دو روش جانهی میانگینی و نمونههای جدید در آمارگیریهای پانلی
در اقتصاد و سایر علوم اجتماعی، پژوهشگران اغلب تمایل به مدلبندی دادههای پانلی که در آن واحدهای نمونهای بهطور مکرر در مقاطع زمانی مختلف مشاهده میشوند، دارند. یکی از کاربردهای دادههای پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیریها به ویژه آمارگیریهای پانلی، بیپاسخی یک مشکل اساسی است که در دادههای علوم اجتماعی و پزشکی به وفور رخ میدهد. این نوع مطالعهها م...
full textمقایسه روش الگوریتم em و روش های متداول جانهی داده های گمشده: مطالعه روی پرسشنامه خوددرمانی بیماران دیابتی
مقدمه و اهداف: داده های گمشده، چالش بزرگی در پژوهش ها به شمار می آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش های گوناگونی برای کار با این داده ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده های پرسشنامه ای بود. روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده ها ...
full textمقایسه روش الگوریتم EM و روشهای متداول جانهی دادههای گمشده: مطالعهروی پرسشنامه خوددرمانی بیماران دیابتی
Background and Objectives: Missing data is a big challenge in the research. According to the type of the study and of the variables, different ways have been proposed to work with these data. This study compared five popular imputation approaches in addressing missing data in the questionnaires. Methods: In this study, 500 questionnaires were used for self-medication in diabetic patients. Mi...
full textتاثیر داده های گمشده در نمودارهای رشد
سابقه و هدف: استفاده از منحنی رشد قدرتمندترین وسیله پایش رشد کودکان می باشد و از این طریق می توان انحرافات از الگوی رشد طبیعی را بموقع تشخیص داد. ریزش داده ها و مقادیر گمشده از مشکلات معمولی در تجزیه و تحلیل داده های طولی رشد محسوب می شود. لذا اهمیت دارد که با برآورد نمودن مقادیر گمشده، داده ها کامل شده و در مسیری مناسب و صحیح جهت تحلیل قرار داده شوند. مواد و روش ها: این مطالعه طولی طی دو سال ب...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده اقتصاد
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023